2024.6.26 GTZAN Dataset
GTZAN Dataset - Music Genre Classification
kaggleが提供する楽曲データセット
10種類のジャンル、各ジャンルに対して100曲の楽曲データとスペクトログラム
フォルダ構成
code:Folder.txt
Data
├─ features_30_sec.csv
├─ features_3_sec.csv
├─ images_original/
└─ genres_original/
楽曲データのジャンルは以下の10種類
blues classical country disco hiphop jazz metal pop reggae rock
images_original/
png形式のスペクトログラムを格納(432x288px)、100KB程度
ファイル名
【ジャンル名】【5桁の番号】.png
なぜかjazzだけ99曲、jazz0054.pngが無かった
genres_original/
wav形式の音声ファイルを格納、各曲の長さは30秒、1,293KB程度
曲名は不明
ファイル名
【ジャンル名】.【5桁の番号】.wav
jazz.00054.wavは存在する
features_3_sec.csv
9990件のデータ、60件の特徴量
features_30_sec.csv
1000件のデータ、60件の特徴量
60件の特徴量について
filename:ファイル名
length :おそらくデータ点数
chroma_stft
rms
spectral_centroid
spectral_bandwidth
rolloff
zero_crossing_rate
harmony
perceptr
tempo:テンポ
mfccXX:メル周波数ケプストラム係数(Mel-Frequency Cepstrum Coefficients: MFCC)
XX :1~20の計20種類についての平均と分散
label:blues:教師データ